不比不知道,我再也不敢用DAVID了
《你昨天才做的分析,可能是几年前的结果!》之前这篇文章,大家应该还记得,这就是富集分析软件的现状,虽然软件很多,但问题同样也很多。
首当其冲的是DAVID,你看它文章的引用数(红色线),2015年直逼6000, 而知识的完整度(蓝色线),一路下降,到2015年只有20%而已。这篇Nature Methods文章的强力吐槽,也促使了DAVID做了一次更新。
你的结论只能反映学界五年前的生物学知识积累。在最近一次更新之前,之前写的《SCIENCE文章用了DAVID被吐槽》大家可能没印象了,我建议你打开看看。
故事大概是文章一发表Pubpeer上马上有人吐槽,然后作者也去承认,确实是有问题。
然后就有人来找我出来遛一遛。
不遛不知道,一遛吓一跳,这个大家看看《SCIENCE文章用了DAVID被吐槽》这篇就行了。
今天不是来炒冷饭的,而是真的有新的发现。在《文章发表:clusterProfiler 4.0 -- The Innovation》一文中,我们也谈到了这个数据完整性的问题,审稿人提出来,DAVID后面又更新了一次,是不是再出来遛一下?于是我就再次看看。拿clusterProfiler
和DAVID
当前最新版(其实也是5年前的版本),再比较一下。
我当前有个比较结果,五年前有个比较结果,如果放在一起看呢?是不是比较有意思?遛呗,结果如下:
结论1:clusterProfiler的结果稍有出入,但变动不大。这是符合期望的,DAVID的结果都被clusterProfiler囊括了,这也是符合期望的,总之就是正如我们期望的,clusterProfiler靠谱!
结论2:DAVID两个版本的结果,竟然几乎完全没有重叠,这太让人震精惊了,震惊到我都打错字了。
也就是说SCIENCE那篇文章,在分析的时间点上,如果DAVID是有及时更新的话,那SCIENCE那篇文章上的结论是第二列的结果,然而由于DAVID没更新,文章用的是第一列的结果。这尼马结论相差也太大了吧。
再者同一份数据,DAVID两次不同的更新,竟然给出完全没有交集的分析结果,完全超越了我们的想象。好了,现在DAVID又超过5年没更新了,假如有更新的话,是不是又要给出不一样的结果呢?画面太美,我不敢想。
你可能认为软件多的是,大不了不用DAVID,然而可不单单DAVID有问题哦,不信你再看看下面两篇文章:
最后的最后,来自Y叔叔的叮嘱:
要想富集分析靠谱,快用clusterProfiler! 要想富集分析应用于不同的物种,包括各种非模式生物,快用clusterProfiler! 要想富集分析应用于不同的知识库,快用clusterProfiler! 要想富集分析结果可以比较,快用clusterProfiler! 要想富集分析出图漂亮,快用clusterProfiler!